草庐IT

ML 方法

全部标签

python - 如何防止 lxml remove 方法删除两个元素之间的文本

我正在使用lxml和python2.7来解析xml文件。我需要在某个时候使用remove方法删除一个元素,但非常奇怪的是它也删除了它后面的一些文本。输入的xml是:Webandgridservices[10,11],wheretheycanproviderichservicedescriptionsthatcanhelpinlocatingsuitableservices.然后我需要将cross-refs元素扩展为多个cross-ref并使用单独的refid。所以输出应该是这样的:Webandgridservices[10][11],wheretheycanproviderichser

c# - 编码 CDATA 元素的有效方法

好的,我正在使用StreamReader从流中读取数据。流中的数据不是xml,它可以是任何东西。基于输入StreamReader,我正在使用XmlTextWriter写入输出流。基本上,总而言之,输出流包含来自输​​入流的数据,这些数据包装在父元素中包含的元素中。我的问题是双重的。数据以block的形式从输入流中读取,StreamReader类返回char[]。如果输入流中的数据包含“]]>”,则需要将其拆分为两个CDATA元素。首先,如何在字符数组中搜索“]]>”?其次,因为我是分块读取的,所以“]]>”子字符串可以分成两个block,那么我该如何解释呢?我可能会将char[]转换为

java - 从 XML 文件中检索两条数据的最佳方法是什么?

我有一个XML文档,它处于FO转换前或转换后的状态,我需要从中提取一些信息。在前例中,我需要提取两个代表pageWidth和pageHeight的标签,而在后例中,我需要从特定标签中提取page-height和page-width参数(我忘了是哪个标签了在我的头顶)。我正在寻找一种有效/易于维护的方式来获取这两个元素。我只想读取文档一次以获取我需要的两件事。我最初开始编写一些会使用BufferedReader+FileReader的东西,但后来我进行了字符串搜索,当标签跨越多行时它变得困惑。然后我查看了DOMParser,它看起来很理想,但如果我可以帮助它,我不想将整个文件读入内存,因

xml - 仅在 XSL 中存在标签时才输出标签的最佳方法是什么?

我正在开发一个与第3方应用程序的接口(interface),该接口(interface)基本上需要获取应用程序吐出的XML并将其转换为我们的系统可以处理的XML。它基本上只是将样式表应用于原始XML以使其看起来像“我们的”XML。我注意到在我们拥有的其他样式表中,有这样的结构:基本上,“in”XML有一个State标记,我需要将其输出为我们识别的StateAbbreviation标记。但是,如果“in”XML包含State标记,我只想输出StateAbbreviation标记。上面的block很好地完成了这一点,但不是很直观(至少对我来说不是),因为每次我看到for-each我都假设有

c# - 过滤部分 XML 文档的有效方法

我正在寻找一种过滤XML文档的有效方法。我正在使用C#/.NET。假设我有以下原始文档:Store1BobABCJohnXYZ我在其他地方存储了另一个部分文档:JohnXYZ使用这两个文档,我需要输出第二个部分XML文档,包括它的原始祖先。Store1JohnXYZ我也愿意接受其他可能的方式来做到这一点。我有一份无法直接操作的原始文档。我需要单独存储对该文档部分的“引用”。然后我需要使用“引用”过滤/翻译原始文档以供显示。 最佳答案 此XSLT转换:JohnXYZ应用于提供的XML文档时:Store1BobABCJohnXYZ产生想

.net - 将 XSL 转换应用于 XElement 的最佳方法是什么?

我有一个通过XElement.Parse()加载的文档,我需要对其应用XSL转换。我该怎么做呢?我知道的唯一方法是使用XPathDocument,我不知道除了XElement->String->StringReader->Stream->XPathDocument之外无法在两者之间进行转换。一定有更好的方法。在相关问题中,将XPath应用于XElement的最佳方法是什么? 最佳答案 为什么不使用:xslt.Transform(xelement.CreateReader(),arglist,someTextWriter);哪里xel

c# - 寻找一种更好的方法来使用 c# 组织 xml 流

我有一个xml流从通过HttpWebResponse传入的Web服务返回。目前我正在将xml加载到XmlTextReader中,然后循环遍历节点以获取变量。这可行,但非常笨拙,因为某些子节点包含的数据会影响我如何组织它之前的数据。据我所知,XmlTextReader只是迭代和前向阅读。因此,如果子节点x包含可能会影响父节点a的数据,那么当我到达子节点x时,我已经读完了父节点a,整个事情非常令人头疼。我对在.net中使用xml比较陌生...有没有更好的方法来解决这个问题?我想大声说出来,我希望能够将入站xml流读入一个对象,我可以在其中说:向我展示所有节点x中的所有内容:然后将它们设置为

python - 有什么方法可以知道 ElementTree DOM 消耗了多少内存?

假设您执行以下操作:dom=ElementTree()dom.parse(some_file_path)我想记录这个dom现在在我的进程中使用的粗略内存量。我不需要精确的东西,粗略的东西就可以了。我认为我无法从源XML文件的大小中得出它。我有一个500KB的文件,如上例所示,它在加载python进程后似乎增加了大约5MB的内存使用量。我查看了ElementTreeAPI,没有看到任何提供此信息的API。有人知道在解析/加载XML文件后了解ElementTree实例使用了多少内存的方法吗? 最佳答案 本质上,您想要查找特定python

xml - 使用 XPath 查找包含给定子元素的元素的清晰方法?

我有这个XML:我想使用XPath提取具有Race子元素的CUnit元素。还有比这更清晰的方法吗?CUnit/Race/.. 最佳答案 使用predicate相反://CUnit[Race] 关于xml-使用XPath查找包含给定子元素的元素的清晰方法?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/9900819/

c# - XPathSelectElement 非常慢;有没有更好的方法来获取给定 XPath 的值?

我有一个文件,基本上是一个XPath列表,如下所示:/Options/File[1]/Settings[1]/Type[1]/Options/File[1]/Settings[1]/Path[1]/Options/File[1]/Settings[2]/Type[1]/Options/File[1]/Settings[2]/Path[1]/Options/File[2]/Settings[1]/Type[1]/Options/File[2]/Settings[1]/Path[1]我需要从中等大小的XML文件(~3-5MB)中的这些XPath指向的元素中获取值。使用XPathSelect